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@ Oas Verfahren bzw. die Einrichtung zum Durchfuhren 
von Cache-Segment-Flush- und Cache-SegmenMnvali- 
dier-Operationen verwendet spezielle Befehle, wobei 
durch Ausfuhren eines einzelnen dieser Befehle durch ei- 
nen Prozessor Daten in einem Segment eines Cache-Spei- 
chers invalidisiert bzw. einer Flush-Operation unterzogen 
werden. Der einzelne Befehl (160) weist einen Befehlsco- 
de (210) und einen ein Register spezifizierenden Abschnitt 
(212) auf. Das von dem Befehl speziftzierte Register ent- 
halt Daten, aus denen eine Startadresse eines Segments 
des Cache-Speichers (300) bestimmt wird. Die in dem Ca- 
che-Segment enthaltenen Daten werden anschlie&end in- 
validiert Oder einer Flush-Operation unterzogen, d. h. aus 
dem Cache- Speicher in einen au Serb alb des Cache-Spei- 
■ chers liegenden Speicherbereich kopiert bzw. geschrie- 
ben. 
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Beschreibung 



Die Erfindung bezieht sich auf Veif ahren und Bnrichtun- 
gen eines Computersystems, welche das Invalidieren und/ 
oder die Flush-Operation eines Abschnitts eines Cache- 5 
Speichers erleichtern. 

Die Verwendung eines Cache-Speichers in einem Com- 
putersystem ermdgiicht die Verringerung der Speicherzu- 
griffszeit. Die grundsatziiche Idee der Cache-Organisation 
besteht darin, daB durch Halten der am haufigsten zugegrif- io 
fenen Befehle und Daten in dem schnellen Cache-Speicher 
die durchschnitdiche Speicherzugriffszeit sich der Zugriffs- 
zeit des Cache-Speichers annahert Um einen optimaien 
KompromiB zwischen der Cache-GroBe und Leistung zu er- 
reichen, implemeniieren typische Computersysteme eine 15 
Cache-Hierarchie, d. h, verschiedene Ebenen von Cache- 
Speichern. Die verschiedenen Ebenen von Cache-Speichern 
korrespondieren mit unterschiedlichen Abstanden von dem 
Kern des Prozessors. Je naher der Cache dem Prozessor ist 
desto schneller ist der Datenzugriff. Je naher der Cache dem 20 
Prozessor ist, desto kostenaufwendiger ist er jedoch zu im- 
piementieren. Im Ergebnis ist der Cache umso schneller und 
kleiner, je naher die Cache-Ebene ist. 

Eine Cache-Einheit ist ublicherweise zwischen dem Pro- 
zessor und dem Hauptspeicher angeordnet; sie umfaBt Ubli- 25 
cherweise eine Cache-Steuereinrichtung (Cache-Controller) 
und einen Cache-Speicher, wie beispielsweise einen stati- 
schen Speicher mit wahlfreiem ZugrifF (SRAM). Die Ca- 
che-Einheit kann auf dem gleichen Chip wie der Prozessor 
enthalten oder als separate Komponente vorhanden sein. Al- 30 
temativ kann die Cache-Steuereinrichtung auf dem Chip des 
Prozessors enthalten und der Cache-Speicher durch exteme 
SRAM-Chips ausgebildet sein. 

Die Leistung des Cache-Speichers wind haufig anhand 
seines Trefferverhal trusses gemessen. Wenn der Prozessor 35 
auf den Speicher Bezug nimmt und Daten in seinem Cache 
vorfindet wird dies als Treffer bezeichnet Wenn die Daten 
nicht in dem Cache gefunden werden, so sind sie in dem 
Hauptspeicher, was als Fehlversuch gezahit wird. Wenn ein 
Fehlversuch auftritt, dann wird eine Zuweisung eines Ein- 40 
trags getroffen, der von der Adresse des Zugriffs indexiert 
wird. Bei dem ZugrifF kann es sich um ein baden von Daten 
in den Prozessor oder ein Speichem von Daten aus dem Pro- 
zessor in den Speicher handeln. Die cache-gespeicherten In- 
formationen werden von dem Cache-Speicher gehalten, bis 45 
sie nicht mehr benotigt werden, ungultig werden oder durch 
andere Daten ersetzt werden, in welchen Fallen die Zuwei- 
sung des Cache- Eintrags aufgehoben wird. 

Wenn andere Prozessoren oder Systemkomponenten Zu- 
grifF auf den Hauptspeicher haben, wie das beispielsweise SO 
bei einem DMA-Controller der Fall ist, und der Hauptspei- 
cher Uberschrieben werden kann, muB die Cache-Steuerein- 
richtung den betroffenen Cache dariiber informieren, daB 
die Daten in dem Cache ungultig sind, sofern sich die Daten 
in dem Hauptspeicher geandert haben. Eine solche Opera- 55 
don ist als Cache-Invalidieren bekannt Wenn die Cache- 
Steuereinrichtung eine Ruckschreib-Strategie implementiert 
und bei einem Cache-TVeffer die Daten nur aus dem Prozes- 
sor in den Cache schreibt, miissen die Cache-Inhalte unter 
speziellen Bedingungen zu dem Hauptspeicher ubertragen 60 
werden. Dies ist beispielsweise der Fall, wenn das DMA- 
Chip Daten aus dem Hauptspeicher zu einer Peripherieein- 
heit ubertragt, aber die aktueUen Werte nur in einem SRAM- 
Cache gespeichert sind. Diese Art der Operation ist als Ca- 
che-Flush-Operation (Cache-Sptilen) bekannt. 65 

Gegenwartig werden derartige Invalidier- und/oder 
Flush-Operationen fur eine zugehorige Cache-Zeile auto- 
matisch von Hardware ausgefUhrt Fur bestimmte Situatio- 



nen wurde Software entwickelt, um den Cache-Speicher zu 
invalidieren und/oder zu sptllen (flush). Gegenwartig umfas- 
sen derartige Softw are-Tec hniken die Verwendung eines 
Befehls, welcher an dem gesamten Cache-Speicher, der zu 
dem Prozessor gehOrt, von welchem der Befehl herrUhrt, 
operiert Jedoch erfordern derartige Invalidier- und/oder 
Flush-Operationen eine groBe Zeitdauer fur ihren Abschiufi 
und bieten keine Granularity oder Steuermdglichkeit fur 
den Benutzer, um spezielle Daten oder Abschnitte von Da- 
ten aus dem Cache zu invalidieren und/oder zu spulen, wah- 
rend andere Daten innerhalb des Cache-Speichers intakt 
bleiben. Wenn eine Flush-Operation nur an dem gesamten 
Cache-Speicher operieren kann, fUhrt das zu einer Inflexibi- 
litat und mindert die Systemleistung. AuBerdem kann eine 
Datenverfaischung auftreten, wenn eine Cache- In validie- 
rungs-Ope ration nur an dem gesamten Cache moglich ist. 

Aufgabe der Erfindung ist es, die genannten Nachteile zu 
vermeiden. 

Diese Aufgabe wird erfindungsgeraaB durch ein Compu- 
tersystem mit den Merkmalen des Patentanspruchs 1 bzw. 7, 
einen Prozessor mit den Merkmalen des Patentanspruchs 13 
bzw. 18, ein Verfahren mit den Merkmalen des Patentan- 
spruchs 24 bzw. 29 bzw. eine computer-iesbare Einrichtung 
mit den Merkmalen des Patentanspruchs 35 bzw. 36 geldst. 

Die Erfindung umfaBt ein Verfahren und eine Einrich- 
tung, die Befehle zum Durchfuhren von Cache-Speicher- In- 
validier- und Cache-Speicher-Flush-Operationen in ein 
Computersystem einbringt Bei einem Ausfuhrungsbeispiel 
umfaBt das Computersystem einen Cache-Speicher mit ei- 
ner Vielzahl von Cache- Zeilen, die jeweils Daten speichem, 
und einen Speicherbereich zum Speichem eines Datenope- 
randen. Eine AusfUhrungseinheit ist mit dem Speicherbe- 
reich gekoppelt und operiert in Abhangigkeit vom Empfang 
eines einzelnen Befehls an Datenelementen in dem Daten- 
operanden, um Daten in einem vorgegebenen Abschnitt der 
Mehrzahl von Cache-Zeilen zu invalidieren. 

Vorteilhafte Weiterbildungen sind in den UnteransprU- 
chen gekennzeichnet 

Im folgenden wird die Erfindung anhand von in der 
Zeichnung dargestellten AusfUhrungsbeispielen naher be- 
schrieben. 

Die Zeichnung umfaBt folgende Figuren: 

Fig. 1 veranschaulicht ein Beispielcomputersystem. 

Fig. 2 veranschaulicht ein Ausfuhrungsbeispiel des For- 
mats eine Cache-Steuerbefehls 160, der bei einem Ausfuh- 
rungsbeispiel der Erfindung vorgesehen ist 

Fig. 3 veranschaulicht die grundsatziiche Betriebsweise 
der Cache-Steuertechnik gemafi einem Ausfuhrungsbeispiel 
der Erfindung. 

Fig. 4A veranschaulicht ein Ausfuhrungsbeispiel der Be- 
triebsweise des Cache-Segment-Invalidier-Befehls 162. 

Fig. 4B veranschaulicht ein Ausfuhrungsbeispiel der Be- 
triebsweise des Cache-Segment-Flush-Befehls 164. 

Fig. 4C veranschaulicht ein Ausfuhrungsbeispiel eines 
Cache-Segment-Rush- und Invalidier-Befehls 166. 

Fig. 5 A ist ein Ablaufdiagramm, das ein Ausfuhrungsbei- 
spiel des Cache-Segment- Invalidier-Prozesses gem£B der 
voriiegenden Erfindung veranschaulicht 

Fig* 5B ist ein Ablaufdiagramm, das ein Ausfuhrungsbei- 
spiel des Cache-Segment-Flush-Prozesses gemaB der vor- 
Uegenden Erfindung veranschauhcht 

In der folgenden Beschreibung werden zahlreiche spe- 
zielle Details angegeben, um ein besseres Verstandnis der 
Erfindung zu erreichen. Es ist jedoch klar, daB die Erfindung 
auch ohne diesen speziellen Details ausgefuhrt werden 
dann. An anderen Stellen werden gut bekannte Schaltungen, 
Strukturen und Techniken nicht im Detail gezeigt, um die 
Erfindung nicht zu verdunkeln. 
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Fig* 1 veranschaulicht ein Computersystem, welches die 
Prinzipien der Erfindung implementieren kann. Das Compu- 
tersystem 100 umfafit einen Prozessor 105, eine Speicher- 
eiruichtung 110 und einen Bus 115. Der Prozessor 105 ist 
rait der Seichereinhchtung 110 Uber den Bus 115 gekoppelt 5 
Die Speichereinrichtung 110 steht steilvertretend fur einen 
oder mehrere Mechanismen zum Speichem von Daten. Bei- 
spieisweise kann die Speichereinrichtung 110 einen Nur- 
Lese-Speicher(ROM), einen Speicher mit wahlfreiem Zu- 
grifF (RAM), ein Magnetplattenspeichermedium, ein opti- io 
sches Speichermedium, Cache-Speicherbauelemente und/ 
oder andere maschinen-lesbare Medien umfassen. Zusatz- 
lich sind eine Reihe von Benutzer-Eingabe/Ausgabe-Ein- 
richtungen, wie beispielsweise eine Tastatur 120 und eine 
Anzeige 125, mit dem Bus 115 gekoppelt. Der Prozessor 15 
105 reprasentiert eine zentrale Verarbeitungseinheit einer 
beliebigen Architektur, wie beispielsweise CISC, RISC, 
VLIW oder Hybrid-Architektur. AuBerdem kann der Pro- 
zessor 105 auf einem oder mehreren Chips implementieri 
sein. Der Bus 115 reprasentiert einen oder mehrere Busse 20 
(zum Beispiel AGP, PCI, ISA. X-Bus, VESA) und Brucken 
(auch als Bussteuereinrichtungen bezeichnet). Wahrend die- 
ses Ausfuhrungsbeispiei unter Bezugnahme auf ein Einzel- 
prozessor-Computersystem beschrieben wind, konnte die 
Erfindung auch in einem Multi-Prozessor-Computersystem 25 
implementiert werden. 

Neben anderen Einrichtungen konnen wahlweise ein oder 
mehrere Netzwerke 130, ein TV-SignalempfBnger 131, ein 
Fax/Modem 132, eine Digitalisiereinheit 133, eine Klang- 
einheit 134 und eine Graphikeinheit 135 mit dem Bus 115 30 
gekoppelt sein. Die Netzwerkeinrichtung 130 und das Fax/ 
Modem 132 reprasentieren eine oder mehrere Netzwerkver- 
bindungen zum Obermitteln von Daten iiber ein maschinen- 
lesbares Medium (z. B. Tragerwellen). Die Digitalisierein- 
heit 133 reprasentiert eine oder mehrere Einrichtungen zum 35 
Digitalisieren von Bildern (beispielsweise einen Scanner, 
eine Kamera, etc.). Die Klangeinheit 134 reprasentiert eine 
oder mehrere Einrichtungen zum Eingeben und/oder Ausge- 
ben von Klangen (z. B. Mikrophone, Lautsprecher, Magnet- 
speicher, etc.). Die Graphikeinheit 135 reprasentiert eine 40 
oder mehrere Einrichtungen zum Erzeugen von 3D-Bildern 
(z. B. Graphikkarten). Fig. 1 veranschaulicht dariiber hin- 
aus, daB die Speichereinrichtung U0 Daten i36 und Soft- 
ware 137 speichert Daten 136 reprasentieren Daten, die in 
einem oder mehreren der hier beschriebenen Formate ge- 45 
speichert sind. Software 137 reprasentiert den notwendigen 
Befehiscode zum Durchfuhren irgendwelcher und/oder 
samtlicher der unter Bezugnahme auf die Fig. 2 und 4 bis 6 
beschriebenen Techniken. Selbstverstandlich enthalt die 
Speichereinrichtung 110 vorzugsweise (nicht gezeigte) zu- 50 
satzliche Software, welche fur das Verstandnis der Erfin- 
dung nicht erforderiich isL 

Fig. 1 veranschaulicht dariiber hinaus, daB der Prozessor 
105 eine Dekodiereinheit 140, einen Registersatz 141, eine 
Ausfuhrungseinheit 142 und einen internen Bus 143 zum 55 
AusfUhren von Befehlen enthalt Der Prozessor 105 enthalt 
ferner zwei interne Cache-Speicher, einen Ebene-0-(L0-) 
Cache-Speicher, welcher mit der Ausfuhrungseinheit 142 
gekoppelt ist, und einen Ebene-l-(Ll-)Cache-Speicher, wel- 
cher mit dem LO-Cache gekoppelt ist. Ein externer Cache- 60 
Speicher, d. h. ein Ebene-2-(L2-)Cache-Speicher 172 ist mit 
dem Bus 115 uber eine Cache-Steuereinrichtung 170 gekop- 
pelt. Die tatsachliche Anordnung der verschiedenen Cache- 
Speicher ist eine Frage der Designauswahl oder kann durch 
die Computersystemarchitektur vorgegeben sein. So ist es 65 
klar, daB der LI -Cache auch auBerhalb des Prozessors 105 
angeordnet werden konnte. Bei altemativen Ausfiihrungs- 
beispielen konnen mehr oder weniger Ebenen von Cache- 
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Speichem (anstelie LI und L2) implementiert werden. In 
Fig. I sind drei Ebenen der Cache-Hierarchie gezeigt, aber 
es konnten mehr oder weniger Cache- Ebenen sein. Bei- 
spielsweise konnte die Erfindung auch dann ausgefuhrt wer- 
den, wenn es nur eine Cache- Ebene (nur L0) oder nur zwei 
Cache-Ebenen (L0 und LI) g&e oder wenn es vier oder 
mehr Cache-Ebenen waren. 

Selbstverstandlich enthalt der Prozessor 105 zusatzliche 
Schaltungen, welche fur das Verstandnis der Erfindung nicht 
erforderiich sind. Die Dekodiereinheit 140, Register 141 
und Ausfuhrungseinheit 142 sind miteinander uber den in- 
ternen Bus 143 gekoppelt. Die Dekodiereinheit 140 wird 
zum Dekodieren von durch den Prozessor 105 empfangenen 
Befehlen in Steuersignale und/oder Mikrobefehlscodeein- 
trittspunkte verwendet In Abhangigkeit von diesen Steuer- 
signalen und/oder Mikrobefehlscodeeintrittspunkten fuhrt 
die Ausfuhrungseinheit 142 die geeigneten Operationen 
durch. Die Dekodiereinheit 140 kann unter Verwendung ei- 
ner beliebigen Anzahl unterschiedlicher Mechanismen im- 
plementiert werden (z. B. einer Nachschlagetabelle, einer 
Hardwareimplementierung, einer PLA, etc.). Wahrend die 
Dekodierung der verschiedenen Befehle hier durch eine Se- 
rie von Wenn/dann-Aussagen reprasentiert wird, ist es klar, 
daB die Ausfuhrung eines Befehls keine serielle Verarbei- 
tung dieser Wenn/dann-Aussagen erfordert. Statt dessen 
wird jeder Mechanismus zum logischen Durchfuhren dieser 
Wenn/dann-Verarbeitung als innerhalb des Umfangs der Im- 
plementierung der Erfindung liegend angesehen. 

Die gezeigte Dekodiereinheit 140 umfafit eine Heranhol- 
einheit 150, welche Befehle heranholt, und einen Befehls- 
satz 155 zum Durchfuhren von Operationen an Daten. Der 
Befehlssatz 155 umfafit erfindungsgemafie Cache-Steuerbe- 
fehle 166. Die Cache-Steuerbefehle 160 umfassen: einen 
Cache-Segment-Invalidier-Befehl, einen Cache-Segment- 
Flush-Befehl und einen Cache-Segment-Rush- und- Invali- 
dier-Befehl. Ein Beispiel des Cache-Segment-Invalidier-Be- 
fehls ist ein Seiten-Invalidier(PGINVD)-Befehl, der an ei- 
ner vom Benutzer spezifizierten linearen Adresse operiert 
und die der-linearen Adresse entsprechende physikalische 
4KByte-Seite aus samtlichen Ebenen der Cache-Hierarchie 
fur samtliche Teilnehmer in dem Computersystem, die mit 
dem Prozessor verbunden sind, invalidiert Ein Beispiel des 
Cache-Segment-Flush-Befehls ist ein Seiten- 
Flush(PGFLUSH)-Befehl, der Daten in der der linearen 
Adresse entsprechenden physikalischen 4KByte-Seite einer 
Flush-Operation unterzieht. Ein Beispiel des Cache-Seg- 
ment-Flush-und-Invalidier-Befehls ist ein Seiten-Flush/In- 
validier(PGFLUSHINV)-Befehl, der zunachst die Daten in 
der der lineraren Adresse entsprechenden physikalischen 
4KByte-Seite einer Flush-Operation unterzieht und dann die 
der lineraren Sresse entsprechende physikalische 4KByte- 
Seite invalidiert. Bei altemativen AusfUhrungsbeispieien 
konnen die Cache-Steuerbefehle entweder an von einem Be- 
nutzer spezifizierten linearen oder physikalischen Adressen 
operieren und die zugehorigen Invalidier- und/oder Flush- 
Operationen gemafi den Prinzipien der Erfindung durchfuh- 
ren. 

Zusatzlich zu den Cache-Segment-Invalidier-Befehlen, 
den Cache-Segment-Flush-Befehlen und den Cache-Seg- 
ment-Flush- und-Invalidier-Befehlen kann der Prozessor 
neue Befehle und/oder Befehle, die denen in vorhandenen 
Mehrzweckprozessoren zu findenden ahnlich sind, enthal- 
ten. Beispielsweise unterstlitzt der Prozessor 105 einen Be- 
fehlssatz, welcher mit dem Intel-Architektur-Befehlssatz 
kompatibel ist, der von vorhandenen Prozessoren verwendet 
wird, wie beispielsweise dem Pennum®-Prozessor. 

Die Register 141 reprasentieren einen Speicherbereich 
des Prozessors 105 zum Speichern von Informationen, wie 
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beispielsweise Steuer/Status- Informational, skaiaren und/ 
Oder gepackten Ganzzahldaten, Gleitkommadaten, etc. Es 
ist kiar, daB ein Aspekt der Erfindung der beschhebene Be- 
fehlssatz ist Gemafi diesem Aspekt der Erfindung ist der 
zum Speichern der Daten verwendete Speicherbereich un- 5 
kritisch. Der Begriff Datenverarbeitungssystem wird hier 
fur irgendeine Einrichtung zum Verarbeiten von Daten ver- 
wendet, einschlieBiich dem unter Bezugnabme auf Fig. 1 
bescbriebenen Prozessor umfaBt, 

Fig. 2 veranschaulicht das Format des Cache-Segment- 10 
In validier- Befehls, des Cache-Segment- Flush-Befehls und 
des Cache-Segment-Flush-und-Invalidier-Befehls gemafi 
der Erfindung. Diese Befehle werden hier als Cache-Steuer- 
Befehle 160 bezeichnet. Die Cache- Steuerbefehle 160 um- 
fassen einen Befehlscode (OP CODE) 210 f welcher die 15 
Operation des Cache-Steuerbefehls 160 angibt, und einen 
Operanden 212, welcher den Namen eines Registers oder ei- 
nes Speicherplatzes spezifiziert, welches bzw. weicher eine 
Startadresse des Datenobjekts halt, an weichem der Befehl 
160 operieren wird. 20 

Fig* 3 veranschaulicht die grundsatzliche Betriebsweise 
des Cache-Steuerbefehls 160. Bei der Ausfuhrung der Erfin- 
dung steilt der Cache-Steuerbefehl 160 den Register-(oder 
Speicher-)Ort zur Verfugung, welcher eine Startadresse des 
Datenobjekts enthalt, an dem der Befehl 160 operieren wird. 25 
Bei einem AusfUhrungsbeispiel umfafit die Startadresse X 
am hochsten bewertete Bits, welche in dem Register- (oder 
Speicher-)Ort gespeichert sind, und Y am geringsten bewer- 
tete Bits. Der dem Cache-Steuerbefehl 160 zugeordnete Ca- 
che-Steuerprozefi verschiebt dann die X Bits nach rechts um 30 
Y Bit-Positionen, um die vollstandige Startadresse zu erlan- 
gen. Dann arbeitet der Cache-Steuerbefehl 160 an den der 
Startadresse entsprechenden Daten in dem Cache-Speicher 
sowie an Daten, die Z nachfolgenden Adressen entsprechen. 
Bei einem AusfUhrungsbeispiel arbeitet der Cache-Steuer- 35 
befehl 160 an einer Seite von Daten, die im Cache-Speicher 
gespeichert ist, von welcher die Anfangsadresse in einem 
Register-(oder Speicher-)Ort gespeichert ist, der in dem 
Operanden 212 des Steuerbefehls spezifiziert ist Bei alter- 
nativen Ausfuhrungsbeispielen kann der Cache-Steurbefehl 40 
160 an einer beliebigen vorgegebenen, in dem Cache ge- 
speicherten Datenmenge operieren, von welcher die An- 
fangsadresse in einem Register oder einem Speicherplatz 
gespeichert ist, das bzw. der von dem Operanden 212 in dem 
Cache-Steuerbefehl spezifiziert ist 45 

In Fig. 1 sind nur die L0-, LI- und L2-Ebenen gezeigt, 
aber es ist klar, daB mehr oder weniger Ebenen einfach im- 
plementiert werden konnen. Das in den Fig. 4 bis 6 gezeigte 
AusfUhrungsbeispiel beschreibt die Benutzung der Erfin- 
dung in bezug auf eine Cache-Ebene. 50 

Details der verschiedenen AusfUhrungsbeispiele der Ca- 
che-Steuerbefehle 160 werden jetzt beschrieben. Zuerst 
wird der Cache-Segment-Invalidier-Befehl 162 beschrie- 
ben. Fig* 4A veranschaulicht ein AusfUhrungsbeispiel des 
Befehls. Bei Empfang des Cache-Segment-Invalidier-Be- 55 
fehls 162 bestimmt der Prozessor 105 aus dem Operanden 
212 des Befehls 162 den Registerort, in weichem die am 
hochsten bewerteten Bits der Startadresse des Datenobjekts 
gespeichert sind. Dann verschiebt der Prozessor 105 den 
Wert in dem Operanden 212 um die Anzahl der am gering- 60 
sten bewerteten Bits der Startadresse. Sobald die vollstan- 
dige Startadresse gewonnen ist, setzt der Prozessor 105 die 
Invalidier-Bits des Cache-Speichers 300 der betroffenen 
Speicherplatze. Bei einem AusfUhrungsbeispiel wird eine 
Seite des Cache-Speichers 320 invalidiert, welche eine 65 
Startadresse aufweist, die der durch den Operanden 212 spe- 
zifizierten entsprichL Bei altemativen AusfUhrungsbeispie- 
len werden unter Verwendung der vorliegenden Technik ir- 
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gendwelche vorgegebenen Abschnitte des Cache-Speichers 
320 invalidiert, die eine Startadresse aufweisen, die derjeni- 
gen entspricht, die durch den Operanden 312 spezifiziert ist. 

Fig. 4B zeigt ein AusfUhrungsbeispiel des Cache-Seg- 
ment-Flush-Befehls 164. Bei Empfang des Cache-Segment- 
Rush-Befehls 164 bestimmt der Prozessor 105 aus dem 
Operanden 312 des Befehls 164 den Registerort, in weichem 
die am hochsten bewerteten Bits der Startadresse des Daten- 
objekts gespeichert sind. Dann verschiebt der Prozessor 105 
den Wert durch die Anzahl der am geringsten bewerteten 
Bits der Startadresse. Sobald die vollstandige Startadresse 
gewonnen ist, unterzieht der Prozessor diejenigen Speicher- 
platze des Cache-Speichers 320 der Rush-Operation, die 
durch die Ausfuhrung des Befehls 164 betrofTen sind. Bei 
einem AusfUhrungsbeispiel wird eine Seite des Cache-Spei- 
chers 320 der Flush-Operation unterzogen, die eine Start- 
adresse aufweist, die dezjenigen durch den Operanden 212 
spezifizierten entspricht Bei altemativen Ausfuhrungsbei- 
spielen werden Daten in irgendwelchen vorgegebenen Ab- 
schnitten des Cache-Speichers 320 der Flush-Operation un- 
terzogen, die eine durch den Operanden 212 spezifizierte 
Startadresse aufweisen. 

Fig. 4C veranschaulicht ein AusfUhrungsbeispiel des Ca- 
che-Segment-Rush-und-Invalidier-Befehls 166. Bei Emp- 
fang des Cache-Segment-Flush-und-Invalidier- Befehls 166 
bestimmt der Prozessor 105 aus dem Operanden 212 des Be- 
fehls 166 den Registerort, an weichem die am hochsten be- 
werteten Bits der Startadresse des Datenobjekts gespeichert 
sind. Dann verschiebt der Prozessor 105 den Wert in dem 
durch den Operanden 212 spezifizierten Register um die 
Anzahl der am geringsten bewerteten Bits der Startadresse. 
Sobald die vollstandige Startadresse gewonnen ist, unter- 
zieht der Prozessor diejenigen Speicherorte des Cache-Spei- 
chers 320 einer Rush-Operation, die durch die Ausfuhrung 
des Befehls 166 betroffen sind. Bei einem AusfUhrungsbei- 
spiel wird eine Seite des Cache-Speichers 320 der Rush- 
Operation unterzogen. Bei einem altemativen AusfUhrungs- 
beispiel werden irgendwelche vorgegebenen Abschnitte des 
Cache-Speichers 320 der Rush-Operation unterzogen, die 
eine durch den Operanden 212 spezifizierte Startadresse 
aufweisen. Als nachstes invalidiert der Prozessor 105 die 
betroffenen Bereiche des Cache-Speichers 320, die der 
Rush-Operation unterzogen wurden. Bei einem AusfUh- 
rungsbeispiel wird dies durch Setzen der Invalidier-Bits je- 
der betroffenen Cache-Zeile durchgefuhrt 

Fig* 5A ist ein Ablaufdiagramm, das ein AusfUhrungsbei- 
spiel des Cache-Segment- In validier- Prozesses gemaB der 
Erfindung veranschaulicht. Beginnend beim Start-Zustand 
fahrt der ProzeB 500 zum Verarbeitungsblock 510 fort, wo 
er den Operanden 212 des von dem Prozessor 105 empfan- 
genen Befehls 162 Uberprilft, um den Speicherort des Werts 
zu bestimmen, der die am hochsten bewerteten Bits der 
Startadresse der zugehorigen Operation darsteUt. Der Pro- 
zeB 500 fahrt dann zum Verarbeitungsblock 512 fort, wo er 
den die am hochsten bewerteten Bits der Startadresse repra- 
sentierenden Wert aus dem spezifizierten Speicherort ge- 
winnL Der ProzeB 500 schreitet dann zum Verarbeitungs- 
block 514 fort, wo er den gewonnenen Wert um eine vorge- 
gebene Anzahl von Bits verschiebt. Bei einem AusfUh- 
rungsbeispiel reprasentiert die vorgegebene Anzahl die An- 
zahl der am geringsten bewerteten Bits in der Startadresse. 
Als nachstes bestimmt der ProzeB 500 das Cache-Segment, 
das durch die Operation bzw. den Befehl 162 betroffen ist, 
wie es im Verarbeitungsblock 516 gezeigt ist Bei einem 
AusfUhrungsbeispiel ist das Cache-Segment eine Seite. Bei 
einem AusfUhrungsbeispiel enthalt eine Seite 4 KBytes. Bei 
altemativen Ausfuhrungsbeispielen kann das Cache-Seg- 
ment ein beliebiger vorgegebener Abschnitt des Cache- 
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Speichers sein. Der ProzeB 500 fahrt dann zum Verarbei- 
tungsblock 518 fort, wo er die Dateo in dem zugehongen 
Cache-Segment beginncnd an der spezifizierten Startadresse 
invalidiert Bei einem AusfUhrungsbeispiei wird dies ausge- 
fuhrt, indem die jeder Cache-Zeile in dem Cache-Segment 5 
entsprechenden Ungultig-Bits oder Invalidier-Bits gesetzt 
werden. Dann endet der ProzeB 500. 

Fig, 5B ist ein Ablaufdiagramm, das ein Ausfuhrungsbei- 
spiel des erfindungsgemaBen Cache-Segment-Rush-Prozes- 
ses veranschaulicht Beginnend im Start-Zustand fahrt der 10 
ProzeB 520 zum Ve rarbei tun gsb lock 522 fort, wo er den 
Operanden 212 des von dem Prozessor 105 empfangenen 
Befehis 164 oder 166 Uberprtift, um den Speicherort desjeni- 
gen Werts zu bestimmen, der die am hochsten bewerteten 
Bits der Startadresse der zugehongen Operation reprasen- 15 
tiert. Der ProzeB 520 fahrt dann zum Verarbeitungsblock 
524 fort, wo er den die am hochsten bewerteten Bits der 
Startadresse reprasentierenden Wert aus dem spezifizierten 
Speicherort gewinnt Der ProzeB 520 schreitet dann zum 
Verarbeitungsblock 526 weiter, wo er den gewonnenen Wert 20 
um eine vorgegebene Anzahl von Bits verschiebL Bei einem 
AusfUhrungsbeispiei reprasendert die vorgegebene Anzahl 
die Anzahl der am geringsten bewerteten Bits in der Start- 
adresse. Als nachstes bestirnmt der ProzeB 520 das von der 
Operation bzw. den Befehlen 164 oder 166 betroffene Ca- 25 
che-Segment wie es im Verarbeitungsblock 528 gezeigt ist. 
Bei einem AusfUhrungsbeispiei ist das Cache-Segment eine 
Seite. Bei alternatives AusfUhrungsbeispielen kann das Ca- 
che-Segment ein beliebiger vorgegebener Abschnitt des Ca- 
che-Speichers sein. Der ProzeB 520 fahrt dann zum Verar- 30 
beitungsblock 530 fort, wo er den Inhalt des spezifizierten 
Cache-Segments in die Speichereinrichtung 110 spiiit 
(flush). Der ProzeB 520 fahrt dann zum Entscheidungsblock 
532 fort, wo er abfragt, ob der empfangene Befehl ein Flush- 
Befehl oder ein Flush- und-Invalidier-Befehl ist. Sofern der 35 
Befehl ein Flush-Befehl ist, endet der ProzeB 520, Sofem 
der Befehl ein Flush- und- In vaiidier- Befehl ist, fahrt der Pro- 
zeB 520 mit dem Verarbeitungsblock 534 fort, wo er die Da- 
ten in dem zugehongen Cache-Segment beginnend an der 
spezifizierten Startadresse invalidiert Bei einem AusfUh- 40 
rungsbeispiel wird dies durchgefUhrt, indem die jeder Ca- 
che-Zeile im Cache-Segment entsprechenden UngUltig-Bits 
bzw. Invalidier-Bits gesetzt werden. Dann endet der ProzeB 
520. 

Die Verwendung der vorliegenden Erfindung verbessert 45 
so rait die Systemleistung, indem ein Invalidier-Befehl und/ 
oder ein Flush-Befehl zum Invalidieren und/oder Spulen 
von Daten in einem beliebigen vorgegebenen Abschnitt des 
Cache-Speichers zur Verfugung gestellt wird. In Fallen, wo 
die Konsistenz zwischen dem Cache-Speicher und dem 50 
Hauptspeicher durch Software aufrechterhalten wird, wird 
die Systemleistung verbessert, da eine Rush-Operation nur 
der betroffenen Abschnitte des Cache-Speichers effektiver 
und flexibler ist als das SpUlen des gesamten Cache-Spei- 
chers. AuBerdem wird die Systemleistung verbessert, indem 55 
Rush- und/oder Invalidier-Operationen zur VerfUgung ge- 
stellt werden, die eine grdBere Granuiarit&t als eine Cache- 
ZeilengroBe haben, da der Benutzer unter Verwendung eines 
einzigen Befehis einen Speicherbereich einer Rush- und/ 
oder Invalidier-Operation unterziehen kann, ohne daB er den 60 
Befehlscode andern muB, wenn das Computersystem die 
GroBe einer Cache-Zeile andert 

PatentansprUche 

65 

1. Computersystem, aufweisend: 

einen Cache-Speicher mit einer Mehrzahl von Daten 

speichemden Cache-Zeilen; 
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einen Speicherbereich zum Speichern eines Datenope- 
randen; und 

einer mit dem Speicherbereich gekoppelten Ausfuh- 
rungseinheit die in Abhangigkeit vom Empfang eines 
einzelnen Befehis an Datenelementen in dem Daten- 
operanden operiert und Daten in einem vorgegebenen 
Abschnitt der Mehrzahl von Cache-Zeilen invalidiert 

2. Computersystem nach Anspruch 1, dadurch ge- 
kennzeichnet daB der Datenoperand ein Registerort ist 

3. Computersystem nach Anspruch 2, dadurch ge- 
kennzeichnet daB der Registerort einen Abschnitt ei- 
ner Startadresse der Cache-Zeile enthalt in welcher 
Daten invalidiert werden so lien. 

4. Computersystem nach Anspruch 3, dadurch ge- 
kennzeichnet daB der Abschnitt der Startadresse meh- 
rere am hochsten bewertete Bits der Startadresse ent- 
halt 

5. Computersystem nach Anspruch 4, dadurch ge- 
kennzeichnet daB die Ausfuhrungseinheit die Daten- 
elemente um eine vorgegebene Anzahl von Bitpositio- 
nen verschiebt, um die Startadresse der Cache-Zeile zu 
gewinnen, in welcher Daten invalidiert werden sollen. 

6. Computersystem nach einem der Anspruche 1 bis 5, 
dadurch gekennzeichnet, daB der vorgegebene Ab- 
schnitt der Mehrzahl von Cache-Zeilen eine Seite in 
dem Cache-Speicher ist 

7. Computersystem, aufweisend: 

einen ersten Speicherbereich zum Speichern von Da- 
ten; 

einen Cache-Speicher mit einer Mehrzahl von Daten 
speichemden Cache-Zeilen; 

einen zweiten Speicherbereich zum Speichern eines 
Datenoperanden, und 

eine mit dem ersten Speicherbereich, dem zweiten 
Speicherbereich und dem Cache-Speicher gekoppelte 
Ausfuhrungseinheit die in Abhangigkeit vom Emp- 
fang eines einzelnen Befehis an Datenelementen in 
dem Datenoperanden operiert, um Daten von einem 
vorgegebenen Abschnitt der Mehrzahl von Cache-Zei- 
len in dem Cache-Speicher in den ersten Speicherbe- 
reich zu kopieren. 

8. Computersystem nach Anspruch 7, dadurch ge- 
kennzeichnet daB der Datenoperand ein Registerort ist 

9. Computersystem nach Anspruch 8, dadurch ge- 
kennzeichnet daB der Registerort eine Mehrzahl von 
am hochsten bewerteten Bits einer Startadresse derjeni- 
gen Cache-Zeile enthalt aus welcher die Daten kopiert 
werden sollen. 

10. Computersystem nach Anspruch 9, dadurch ge- 
kennzeichnet daB die Ausfuhrungseinheit die Daten- 
elemente um eine vorgegebene Anzahl von Bitpositio- 
nen verschiebt um die Startadresse der Cache-Zeile zu 
gewinnen, aus welcher die Daten kopiert werden sol- 
len. 

11. Computersystem nach einem der Anspruche 7 bis 

10, dadurch gekennzeichnet daB der vorgegebene Ab- 
schnitt der Mehrzahl von Cache-Zeilen eine Seite in 
dem Cache-Speicher ist 

12. Computersystem nach einem der Anspruche 7 bis 

11, dadurch gekennzeichnet dafi die Ausfuhrungsein- 
heit dariiber hinaus in Erwiderung des Empfangs eines 
einzigen Befehis Daten in dem vorgegebenen Ab- 
schnitt der Mehrzahl von Cache-Zeilen nach dem Ko- 
pieren der Daten in den ersten Speicherbereich invali- 
diert. 

13. Prozessor, aufweisend: 

einen Dekodierer zum Dekodieren von Befehlen, und 
eine mit dem Dekodierer gekoppelte Schaltung, die in 



DE 199 34 

9 

Erwiderung eines einzelnen dekodierten Befehls: 
eine Startadresse eines vorgegebenen Bereichs eines 
Cache-Speichers gewinnt, an welchem der Befehi 
durchgeruhrt werden wild; 

Daien in dem vorgegebenen Bereich des Cache-Spei- 5 
chers invalidiert 

14. Prozessor nach An sprue h 13, dadurcb gekenn- 
zeichnet, dafl ein Abschnitt der Startadresse in einem in 
dem dekodierten Befehi spezifizierten Register ange- 
ordnet ist. 10 

15. Prozessor nach Anspruch 14, dadurch gekenn- 
zeichnet, daB der Abschnitt der Startadresse eine Mehr- 
zahi der am hochsten bewerteten Bits der Startadresse 
umfafiL 

16. Prozessor nach Anspruch 15, dadurch gekenn- 15 
zeichnet, daB die Schaltung die Datenelemente urn eine 
vorgegebene Anzahl von Bit-Positionen verschiebt, um 
die Startadresse des Cache-Bereichs zu gewinnen, in 
welchem die Daten invalidiert werden sollen. 

17. Prozessor nach einem der Ansprtiche 1 3 bis 1 6, da- 20 
durch gekennzeichnet, dafi der vorgegebene Bereich 
des Cache-Speichers eine Seite in dem Cache-Speicher 
ist. 

18. Prozessor, aufweisend: 

einen Dekodierer zum Dekodieren von Befehlen, und 25 
eine mit dem Dekodierer gekoppelte Schaltung, die in 
Erwiderung eines einzelnen dekodierten Befehls: 
eine Startadresse eines vorgegebenen Bereichs eines 
Cache-Speichers gewinnt, an welchem der Befehi 
durchgefQhrt wird; 30 
Daten aus dem vorgegebenen Bereich des Cache-Spei- 
chers kopiert; und 

die kopierten Daten in einem von dem Cache-Speicher 
getrennten Speicherbereich speichert 

19. Prozessor nach Anspruch 18, dadurch gekenn- 35 
zeichnet, dafi ein Abschnitt der Startadresse in einem in 
dem dekodierten Befehi spezifizierten Register ange- 
ordnet ist. 

20. Prozessor nach Anspruch 19, dadurch gekenn- 
zeichnet, dafi der Abschnitt der Startadresse eine Mehr- 40 
zahl von am hochsten bewerteten Bits der Startadresse 
umfafiL 

21. Prozessor nach Anspruch 20, dadurcb gekenn- 
zeichnet, dafi die Schaltung die Datenelemente um eine 
vorgegebene Anzahl von Bitpositionen verschiebt, um 45 
die Startadresse des Cache-Bereichs zu gewinnen, aus 
welchem die Daten kopiert werden sollen. 

22. Prozessor nach einem der Anspruche 1 8 bis 21 , da- 
durch gekennzeichnet, daB der vorgegebene Bereich 
des Cache-Speichers eine Seite in dem Cache-Speicher 50 
ist. 

23. Prozessor nach einem der Ansprtiche 1 8 bis 22, da- 
durch gekennzeichnet, daB die Schaltung femer die 
Daten in dem vorgegebenen Bereich des Cache-Spei- 
chers in Erwiderung des Empfangs des einzelnen Be- 55 
fehls nach Kopieren der Daten in dem Speicherbereich 
invalidiert 

24. Computer-implementiertes Verfahren, wobei: 

a) ein einzelner Befehi dekodiert wird; 

b) in Erwiderung des Dekodierens des einzelnen 60 
Befehls eine Startadresse eines vorgegebenen Be- 
reichs eines Cache-Speichers gewonnen wird, an 
welchem Bereich der einzelne Befehi durchge- 
fuhrt wird; und 

c) die Ausfuhrung des einzelnen Befehls abge- 65 
schlossen wird, indem Daten in dem vorgegebe- 
nen Bereich des Cache-Speichers invalidiert wer- 
den. 
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25. Verfahren nach Anspruch 24, dadurch gekenn- 
zeichnet, dafi beim Invalidieren Ungtiltig-Bits in dem 
vorgegebenen Bereich des Cache-Speichers gesetzt 
werden. 

26. Verfahren nach Anspruch 24 oder 25, dadurch ge- 
kennzeichnet, dafi zum Gewinnen der Startadresse: 

b.l) ein Abschnitt der Startadresse aus einem in 
dem dekodierten Befehi spezifizierten Speicher- 
platz gewonnen wird; 

b.2) der Abschnitt der Startadresse um eine vorge- 
gebene Anzahl von Positioner! verschoben wird 

27. Verfahren nach Anspruch 26, dadurch gekenn- 
zeichnet, dafi im Schritt b.l) der Abschnitt der Start- 
adresse eine Mehrzahl von am hochsten bewerteten 
Bits der Startadresse enthalt, und dafi im Schritt b.2) 
die vorgegebene Anzahl von Bitpositionen die Anzahl 
der am geringsten bewerteten Bits der Startadresse dar- 
stellt. 

28. Verfahren nach einem der Anspruche 24 bis 27, 
dadurch gekennzeichnet, dafi der vorgegebene Bereich 
des Cache-Speichers eine Seite in dem Cache-Speicher 
ist 

29. Computer-implementiertes Verfahren, wobei: 

a) ein einzelner Befehi dekodiert wird; 

b) in Erwiderung des Dekodierens des einzelnen 
Befehls eine Startadresse eines vorgegebenen Be- 
reichs eines Cache-Speichers gewonnen wird, an . 
welchem Bereich der einzelne Befehi durchge- 
fuhrt wird; und 

c) die AusfUhrung des einzelnen Befehls abge- 
schlossen wird, indem Daten aus dem vorgegebe- 
nen Bereich des Cache-Speichers kopiert und die 
kopierten Daten in einem von dem Cache-Spei- 
cher getrennten Speicherbereich gespeichert wer- 
den. 

30. Verfahren nach Anspruch 29, dadurch gekenn- 
zeichnet, dafi im Schritt b): 

b.l) ein Abschnitt der Startadresse aus einem in 
dem dekodierten Befehi spezifizierten Speicher- 
platz gewonnen wird; 

b.2) der Abschnitt der Startadresse um eine vorge- 
gebene Anzahl von Bitpositionen verschoben 
wird, um die Startadresse des Cache-Bereichs zu 
eriangen, aus welchem Daten kopiert werden sol- 
len. 

31. Verfahren nach Anspruch 30, dadurch gekenn- 
zeichnet, dafi im Schritt b.l) der Abschnitt der Start- 
adresse eine Mehrzahl von am hochsten bewerteten 
Bits der Startadresse enthalt, und dafi im Schritt b.2) 
die vorgegebene Anzahl von Bitpositionen die Anzahl 
der am geringsten bewerteten Bits der Startadresse re- 
prasentiert 

32. Verfahren nach einem der Anspruche 29 bis 31, 
dadurch gekennzeichnet, dafi der vorgegebene Bereich 
des Cache-Speichers eine Seite in dem Cache-Speicher 
ist 

33. Verfahren nach einem der Ansprtiche 29 bis 32, 
dadurch gekennzeichnet, daB 

d) die Daten in dem vorgegebenen Bereich des 
Cache-Speichers in Erwiderung des Empfangs 
des einzelnen Befehls nach dem Kopieren der Da- 
ten zu dem Speicherbereich invalidiert werden. 

34. Computer-lesbare Einrichtung, aufweisend: 

ein computer- lesb ares Medium, das einen Befehi spei- 
chert, welcher dann, wenn er von einem Prozessor aus- 
geftihrt wird, den Prozessor veranlafit: 
eine Startadresse eines vorgegebenen Bereichs eines 
Cache-Speichers, in welchem der Befehi durchgeftihrt 
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wird, zu gewinnen; und 

Oaten in dem vorgegebenen Bereich des Cache-Spei- 
cbers zu invalidieren. 

35. Computer- lesbare Einrichtung, aufweisend: 

ein computer- Lesb ares Medium, das einen Befehl spei- 5 
chert, welchex dann, wenn er von einem Prozessor aus- 
gefuhrt wird, den Prozessor veranlafiu 
eine Startadresse eines vorgegebenen Bereichs eines 
Cache-Speichers, in welchem der Befehl durchgeruhrt 
wird, zu gewinnen; 10 
Daten aus dem vorgegebenen Bereich des Cache-Spei- 
chers zu kopieren; und 

die kopierten Daten in einem von dem Cache-Speicher 
getrennten Speicherbereich zu speichem. 

36. Einrichtung nach Anspruch 35, dadurch gekenn- is 
zeichnet, dafi der Befehl femer den Prozessor veran- 
lafit, die Daten in dem vorgegebenen Bereich des Ca- 
che-Speichers nach dem Kopieren der Daten in den 
Speicherbereich zu invalidieren. 
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